0%

Block Chain

blockchain.jpg

本质上,区块链是一个人人拥有至少一部分的分布式的公开的数据库,任何一个新的数据记录,只能在多数数据库持有者(维护者)的多数同意之后才能被加入到数据库中。

区块链入门教程

作者: 阮一峰
日期: 2017年12月26日

区块链(blockchain)是眼下的大热门,新闻媒体大量报道,宣称它将创造未来。

可是,简单易懂的入门文章却很少。区块链到底是什么,有何特别之处,很少有解释。

下面,我就来尝试,写一篇最好懂的区块链教程。毕竟它也不是很难的东西,核心概念非常简单,几句话就能说清楚。我希望读完本文,你不仅可以理解区块链,还会明白什么是挖矿、为什么挖矿越来越难等问题。

需要说明的是,我并非这方面的专家。虽然很早就关注,但是仔细地了解区块链,还是从今年初开始。文中的错误和不准确的地方,欢迎大家指正。

一、区块链的本质
区块链是什么?一句话,它是一种特殊的分布式数据库。

首先,区块链的主要作用是储存信息。任何需要保存的信息,都可以写入区块链,也可以从里面读取,所以它是数据库。

其次,任何人都可以架设服务器,加入区块链网络,成为一个节点。区块链的世界里面,没有中心节点,每个节点都是平等的,都保存着整个数据库。你可以向任何一个节点,写入/读取数据,因为所有节点最后都会同步,保证区块链一致。

二、区块链的最大特点
分布式数据库并非新发明,市场上早有此类产品。但是,区块链有一个革命性特点。

区块链没有管理员,它是彻底无中心的。其他的数据库都有管理员,但是区块链没有。如果有人想对区块链添加审核,也实现不了,因为它的设计目标就是防止出现居于中心地位的管理当局。

正是因为无法管理,区块链才能做到无法被控制。否则一旦大公司大集团控制了管理权,他们就会控制整个平台,其他使用者就都必须听命于他们了。

但是,没有了管理员,人人都可以往里面写入数据,怎么才能保证数据是可信的呢?被坏人改了怎么办?请接着往下读,这就是区块链奇妙的地方。

三、区块

区块链由一个个区块(block)组成。区块很像数据库的记录,每次写入数据,就是创建一个区块。

每个区块包含两个部分。

区块头(Head):记录当前区块的元信息
区块体(Body):实际数据
区块头包含了当前区块的多项元信息。

生成时间
实际数据(即区块体)的 Hash
上一个区块的 Hash

这里,你需要理解什么叫 Hash,这是理解区块链必需的。

所谓 Hash 就是计算机可以对任意内容,计算出一个长度相同的特征值。区块链的 Hash 长度是256位,这就是说,不管原始内容是什么,最后都会计算出一个256位的二进制数字。而且可以保证,只要原始内容不同,对应的 Hash 一定是不同的。

举例来说,字符串123的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六进制),转成二进制就是256位,而且只有123能得到这个 Hash。

因此,就有两个重要的推论。

推论1:每个区块的 Hash 都是不一样的,可以通过 Hash 标识区块。
推论2:如果区块的内容变了,它的 Hash 一定会改变。

四、 Hash 的不可修改性
区块与 Hash 是一一对应的,每个区块的 Hash 都是针对”区块头”(Head)计算的。

Hash = SHA256(区块头)

上面就是区块 Hash 的计算公式,Hash 由区块头唯一决定,SHA256是区块链的 Hash 算法。

前面说过,区块头包含很多内容,其中有当前区块体的 Hash(注意是”区块体”的 Hash,而不是整个区块),还有上一个区块的 Hash。这意味着,如果当前区块的内容变了,或者上一个区块的 Hash 变了,一定会引起当前区块的 Hash 改变。

这一点对区块链有重大意义。如果有人修改了一个区块,该区块的 Hash 就变了。为了让后面的区块还能连到它,该人必须同时修改后面所有的区块,否则被改掉的区块就脱离区块链了。 由于后面要提到的原因,Hash 的计算很耗时,同时修改多个区块几乎不可能发生,除非有人掌握了全网51%以上的计算能力。

正是通过这种联动机制,区块链保证了自身的可靠性,数据一旦写入,就无法被篡改。这就像历史一样,发生了就是发生了,从此再无法改变。

每个区块都连着上一个区块,这也是”区块链”这个名字的由来。

五、采矿
由于必须保证节点之间的同步,所以新区块的添加速度不能太快。试想一下,你刚刚同步了一个区块,准备基于它生成下一个区块,但这时别的节点又有新区块生成,你不得不放弃做了一半的计算,再次去同步。因为每个区块的后面,只能跟着一个区块,你永远只能在最新区块的后面,生成下一个区块。所以,你别无选择,一听到信号,就必须立刻同步。

所以,区块链的发明者中本聪(这是假名,真实身份至今未知)故意让添加新区块,变得很困难。他的设计是,平均每10分钟,全网才能生成一个新区块,一小时也就六个。

这种产出速度不是通过命令达成的,而是故意设置了海量的计算。也就是说,只有通过极其大量的计算,才能得到当前区块的有效 Hash,从而把新区块添加到区块链。由于计算量太大,所以快不起来。

这个过程就叫做采矿(mining),因为计算有效 Hash 的难度,好比在全世界的沙子里面,找到一粒符合条件的沙子。计算 Hash 的机器就叫做矿机,操作矿机的人就叫做矿工。

六、难度系数
读到这里,你可能会有一个疑问,人们都说采矿很难,可是采矿不就是用计算机算出一个 Hash 吗,这正是计算机的强项啊,怎么会变得很难,迟迟算不出来呢?

原来不是任意一个 Hash 都可以,只有满足条件的 Hash 才会被区块链接受。这个条件特别苛刻,使得绝大部分 Hash 都不满足要求,必须重算。

原来,区块头包含一个难度系数(difficulty),这个值决定了计算 Hash 的难度。举例来说,第100000个区块的难度系数是 14484.16236122。

区块链协议规定,使用一个常量除以难度系数,可以得到目标值(target)。显然,难度系数越大,目标值就越小。

Hash 的有效性跟目标值密切相关,只有小于目标值的 Hash 才是有效的,否则 Hash 无效,必须重算。由于目标值非常小,Hash 小于该值的机会极其渺茫,可能计算10亿次,才算中一次。这就是采矿如此之慢的根本原因。

区块头里面还有一个 Nonce 值,记录了 Hash 重算的次数。第 100000 个区块的 Nonce 值是274148111,即计算了 2.74 亿次,才得到了一个有效的 Hash,该区块才能加入区块链。

七、难度系数的动态调节
就算采矿很难,但也没法保证,正好十分钟产出一个区块,有时一分钟就算出来了,有时几个小时可能也没结果。总体来看,随着硬件设备的提升,以及矿机的数量增长,计算速度一定会越来越快。

为了将产出速率恒定在十分钟,中本聪还设计了难度系数的动态调节机制。他规定,难度系数每两周(2016个区块)调整一次。如果这两周里面,区块的平均生成速度是9分钟,就意味着比法定速度快了10%,因此难度系数就要调高10%;如果平均生成速度是11分钟,就意味着比法定速度慢了10%,因此难度系数就要调低10%。

难度系数越调越高(目标值越来越小),导致了采矿越来越难。

八、区块链的分叉
即使区块链是可靠的,现在还有一个问题没有解决:如果两个人同时向区块链写入数据,也就是说,同时有两个区块加入,因为它们都连着前一个区块,就形成了分叉。这时应该采纳哪一个区块呢?

现在的规则是,新节点总是采用最长的那条区块链。如果区块链有分叉,将看哪个分支在分叉点后面,先达到6个新区块(称为”六次确认”)。按照10分钟一个区块计算,一小时就可以确认。

由于新区块的生成速度由计算能力决定,所以这条规则就是说,拥有大多数计算能力的那条分支,就是正宗的比特链。

九、总结
区块链作为无人管理的分布式数据库,从2009年开始已经运行了8年,没有出现大的问题。这证明它是可行的。

但是,为了保证数据的可靠性,区块链也有自己的代价。一是效率,数据写入区块链,最少要等待十分钟,所有节点都同步数据,则需要更多的时间;二是能耗,区块的生成需要矿工进行无数无意义的计算,这是非常耗费能源的。

因此,区块链的适用场景,其实非常有限。

不存在所有成员都信任的管理当局
写入的数据不要求实时使用
挖矿的收益能够弥补本身的成本

如果无法满足上述的条件,那么传统的数据库是更好的解决方案。

目前,区块链最大的应用场景(可能也是唯一的应用场景),就是以比特币为代表的加密货币。下一篇文章,我将会介绍比特币的入门知识。

十、参考链接
How does blockchain really work?, by Sean Han
Bitcoin mining the hard way: the algorithms, protocols, and bytes, by Ken Shirriff

技术大神:区块链的本质是什么

布莱恩·贝伦多夫(Brian Behlendorf)是开源软件行业的传奇人物。他是世界使用排名第一的Web服务器软件的主力开发者, 还是世界经济论坛的首席技术官。2016年时,贝伦多夫加入了Linux基金会旗下的超级账本项目(Hyperledger Project)担任执行董事。超级账本项目的目的,是建立一个透明、共享、去中心化的分布式账薄技术,并且让这一技术成为金融业、银行业、制造业、保险业和物联网的技术支撑。它是一个致力于推进区块链技术的开源项目,包括IBM、英特尔和摩根大通在内的很多公司都是这个项目的成员。

在《麻省理工科技评论》举办的活动上,贝伦多夫解释了他理解中的区块链。新媒体新芽整理他的演讲。

贝伦多夫说,区块链包括了两个概念:

分布式账本和智能合约。分布式账本是一个独特的数据库,它记录的内容不会被篡改,而且永远不会丢失。智能合约是交易双方互相联系的工具,比如如果一个人和另一个人打赌,明天北京会下雨,然后用智能合约记录这个打赌。如果没下雨,智能合约会自动把钱交给赢了的人。

区块链技术可以追踪产品的一切。比如,钻石行业曾经联手建立了一个项目,来阻止暴力冲突地区开采出的“血钻”进入市场。在这个项目中,钻石被开采出来那一刻,就被记入区块链,此后的交易、运输每个环节都被记录下。如果你买到一颗钻石,区块链里没有它的记录,那么,它就是一颗来源不明的钻石,很可能就是“血钻”。

同样,如果把房地产数据放到区块链上,就能追踪到交易的每个过程,知道这个房子曾经的房主是谁、是否曾经被抵押过,历史上交易过几次,而且,这种记录都是不可被篡改的。

贝伦多夫说,区块链服务可以按照公有和私有,许可和非许可来划分。公有和私有指的是谁可能读取区块链,是所有人都可以,还是只有指定的人可以;许可和非许可是指谁能写区块链。个人的健康数据是非公开许可的,数据只有指定人读取,但是会有很多人可以写记录;房屋数据是公开许可的,很多人可以读取到数据,也能写数据。比特币和以太坊是公开非许可的,很多人可以读取到数据,但是不能写数据。

贝伦多夫也提到了区块链的安全问题。他说,所有的软件都有漏洞,区块链中也会潜伏危险,“黑客能用垃圾数据来冲垮我们的系统。此外,由于区块链具有不可逆性,一旦漏洞发现,可能会导致永久不可逆的数据泄露。”因此,

当区块链承载了个人数据,也就需要第三方监督,也就是所谓的“社群合约”,“它可以是国家的法律,或人为的规定。但无论是什么,一定要对智能合约和区块链有一定的治理。”

他还建议区块链技术的开发者,“一定要尤其注意那些添加的新节点。它们很可能为垄断者所利用。”

使用 Go 语言打造区块链(一)

作者:Ivan Kuznetsov
中文翻译:李笑来
原文链接:https://jeiwan.cc/posts/building-blockchain-in-go-part-1/

第一部分:基础原型

简介

区块链是二十一世纪最具革命性的技术之一,它正在不断成熟,它的诸多潜力正在逐步实现中。本质上来看,区块链只不过是一个分布式的数据库。之所以区块链独特,是因为它并不是一个私有数据库,而是一个公开的数据库,即,每一个使用它的人拥有这个数据库的全部或者至少一部分。任何一个新的数据记录,只能在多数数据库持有者(维护者)的多数同意之后被加入数据库。正因如此,区块链使得加密货币以及智能合约成为可能。

在这个系列文章中,我们将打造一个简化版本的加密货币,它将基于一个简化版本的区块链实现。

区块(Block)

让我们先从区块开始。在区块链里,价值信息存储在区块之中。比如,比特币的区块存储交易记录,而交易记录是任何加密货币的核心。除此之外,区块里还包含有技术信息,比如它的版本号,当前的时间戳,以及上一个区块的哈希(Hash)。

在这篇文章中,我们所实现的并不是像比特币那样完整的区块链,而是一个简化版本的区块链,它只含有最基本的核心信息。差不多是这样:

1
2
3
4
5
6
type Block struct {
Timestamp int64
Data []byte
PrevBlockHash []byte
Hash []byte
}

在这里,Timestamp是当前的时间戳(即,区块被创建的时间),Data是区块中包含的价值信息,PrevBlockHash 存储的是上一个区块的哈希,而Hash 保存的是当前区块的哈希。在比特币的标配中,Timestamp、PrevBlockHash、Hash是区块的头部数据(Block headers),构成一个单独的数据结构;而交易记录(Transactions,在我们这个版本中就是 Data),是另外一个单独的数据结构。而我们在这里为了简化,把数据结构混在了一起。

那我们如何计算哈希呢?计算哈希的方式是区块链的重要特征之一,也正是这个特性使得区块链如此安全。关键在于,计算哈希是一个计算起来很困难的工作,它需要时间,哪怕是在很快的计算机上(这就是为什么人们要买比 CPU 计算能力更强悍 GPU 甚至专门的 ASIC 芯片做矿机的 原因)。这是故意如此设计的,这么做的结果是,往区块链(数据库)里添加新的区块(数据)有一定的困难,以此保证一旦新的数据被加入,往后很难篡改。以后的文章里会进一步讨论并实现这个机制。

现在呢,我们只需要把区块里的各个字段关联起来,并在此基础上计算出一个 SHA-256 哈希。让我们调用一下 SetHash这个方法:

1
2
3
4
5
6
func (b *Block) SetHash() {
timestamp := []byte(strconv.FormatInt(b.Timestamp, 10))
headers := bytes.Join([][]byte{b.PrevBlockHash, b.Data, timestamp}, []byte{})
hash := sha256.Sum256(headers)
b.Hash = hash[:]
}

接下来,依据 Golang 的常用方式,我们将实现一个函数,以便更简单地创建区块:

1
2
3
4
5
func NewBlock(data string, prevBlockHash []byte) *Block {
block := &Block{time.Now().Unix(), []byte(data), prevBlockHash, []byte{}}
block.SetHash()
return block
}

就这么简单。

区块链(Blockchain)

现在,让我们来实现区块链。本质上来看,区块链只不过是一个特定结构的数据库,它是一个有序的,反向链接的列表(back-linked list)。这就意味着说,区块是按照插入的顺序排列的,每个区块都链接到上一个区块。这样的结构,使得使用者可以很快地在区块链中获得最新的区块,也可以很有效率地通过区块的哈希获得某个区块。

在 Golang 中,这种结构可以用数组(Array)与数图(Map) 实现:数组用来维护有序哈希(在 Go 语言中,数组是有序的);数图(Map) 用来维护 hash → block 对。不过,在我们的区块链原型中,我们只需要数组就可以了,因为我们暂时不需要通过哈希获取区块。

1
2
3
type Blockchain struct {
blocks []*Block
}

这就是我们的第一个区块链!我从来没想到竟然会这么简单!

现在,我们要想办法往区块链里添加区块了:

1
2
3
4
5
func (bc *Blockchain) AddBlock(data string) {
prevBlock := bc.blocks[len(bc.blocks)-1]
newBlock := NewBlock(data, prevBlock.Hash)
bc.blocks = append(bc.blocks, newBlock)
}

这就完事儿了?或者……?

为了添加新的区块,我们需要一个已经存在的区块,可现在我们的区块链里面没有任何区块!于是,在任何区块链中,应该至少有一个区块,这第一个区块,被称为“创始块”(Genesis Block)。来,让我们实现一个方法去创建这个“创始块”:

NewGenesisBlock() *Block {
1
2
  return NewBlock("Genesis Block", []byte{})
}

现在我们就可以创建一个函数,用来创建一个已含有“创始块”的区块链了:

1
2
3
func NewBlockchain() *Blockchain {
return &Blockchain{[]*Block{NewGenesisBlock()}}
}

让我们来看看这区块链是否能用?

1
2
3
4
5
6
7
8
9
10
11
func main() {
bc := NewBlockchain()
bc.AddBlock("Send 1 BTC to Ivan")
bc.AddBlock("Send 2 more BTC to Ivan")
for _, block := range bc.blocks {
fmt.Printf("Prev. hash: %x\n", block.PrevBlockHash)
fmt.Printf("Data: %s\n", block.Data)
fmt.Printf("Hash: %x\n", block.Hash)
fmt.Println()
}
}

输出结果是:

1
2
3
4
5
6
7
8
9
Prev. hash:
Data: Genesis Block
Hash: aff955a50dc6cd2abfe81b8849eab15f99ed1dc333d38487024223b5fe0f1168
Prev. hash: aff955a50dc6cd2abfe81b8849eab15f99ed1dc333d38487024223b5fe0f1168
Data: Send 1 BTC to Ivan
Hash: d75ce22a840abb9b4e8fc3b60767c4ba3f46a0432d3ea15b71aef9fde6a314e1
Prev. hash: d75ce22a840abb9b4e8fc3b60767c4ba3f46a0432d3ea15b71aef9fde6a314e1
Data: Send 2 more BTC to Ivan
Hash: 561237522bb7fcfbccbc6fe0e98bbbde7427ffe01c6fb223f7562288ca2295d1

(竟然)完工!

结论

我们创建了一个极简的区块链原型:它只不过是一个由区块构成的数组,每个区快链接指向上一个区块。当然,真正的区块链远比这个复杂的多。在我们的区块链里,添加一个新区块非常快,非常容易;但是在真正的区块链中添加一个新的区块需要更多的工作:在获得添加区块的允许之前要做很繁重的计算才行(这个过程被称为“工作证明机制”,即,“Proof-of-Work”,POW)。并且,区块链是一个没有主权的分布式的数据库。因此,任何一个新的区块在被加入之前,必须经过网络中其它参与者的确认与允许(这个机制被称为“共识机制”,“Consensus”)…… 还有,我们的区块链里,还没有任何交易记录呢!

未来的文章里,我们将进一步实现这些特性。

链接:

Full source codes: https://github.com/Jeiwan/blockchain_go/tree/part_1
Block hashing algorithm: https://en.bitcoin.it/wiki/Block_hashing_algorithm

欢迎关注我的其它发布渠道